AI资讯新闻榜单内容搜索- AI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索:  AI
对话Manus肖弘:Manus和Monica诞生背后,创始人的完整思考

对话Manus肖弘:Manus和Monica诞生背后,创始人的完整思考

对话Manus肖弘:Manus和Monica诞生背后,创始人的完整思考

和DeepSeek等从大模型开始构建底层能力的AI公司不同,Manus AI是一家从day 1就只做AI应用的创业公司。

来自主题: AI资讯
10228 点击    2025-03-16 16:42
声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷

声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷

声音比真人还像真人的Maya,背后模型开源了!跨越语音恐怖谷

语音恐怖谷是指在语音合成技术中,当 AI 合成语音接近人类的真实语音,但又存在细微的不自然或不完美之处时,会引发人类的不适感。

来自主题: AI技术研报
9835 点击    2025-03-16 15:29
AI进入推理模型时代,一文带你读懂思维链

AI进入推理模型时代,一文带你读懂思维链

AI进入推理模型时代,一文带你读懂思维链

近段时间,推理模型 DeepSeek R1 可说是 AI 领域的头号话题。用过的都知道,该模型在输出最终回答之前,会先输出一段思维链内容。这样做可以提升最终答案的准确性。

来自主题: AI技术研报
9470 点击    2025-03-16 14:53
人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板

人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板

人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板

当前,视觉语言模型(VLMs)的能力边界不断被突破,但大多数评测基准仍聚焦于复杂知识推理或专业场景。本文提出全新视角:如果一项能力对人类而言是 “无需思考” 的本能,但对 AI 却是巨大挑战,它是否才是 VLMs 亟待突破的核心瓶颈?

来自主题: AI技术研报
7568 点击    2025-03-15 15:05
CVPR 2025 | VAST和北航开源MIDI,从单张图像端到端生成三维组合场景

CVPR 2025 | VAST和北航开源MIDI,从单张图像端到端生成三维组合场景

CVPR 2025 | VAST和北航开源MIDI,从单张图像端到端生成三维组合场景

在 Sora 引爆世界模型技术革命的当下,3D 场景作为物理世界的数字基座,正成为构建动态可交互 AI 系统的关键基础设施。当前,单张图像生成三维资产的技术突破,已为三维内容生产提供了 "从想象到三维" 的原子能力。

来自主题: AI技术研报
8849 点击    2025-03-14 15:40